home *** CD-ROM | disk | FTP | other *** search
/ Trading on the Edge / Trading On The Edge - CD-ROM Toolkit (Wayzata Technology)(2031)(1994).bin / pc / pc_files / venddemo / visanlst / t001 < prev    next >
Text File  |  1993-01-27  |  6KB  |  150 lines

  1. .LsnName Information Harvesting
  2. .LsnDesc Flow diagrams illustrating the functions of the 
  3. Information Harvesting software.
  4. .LsnScts What is IH?, Rule Generator, Inference Engine, Advantages, How it works
  5. .LsnPrms Estimation data glosintr
  6.  
  7. .What
  8. ~G~m 40 40 0 0
  9.  Finding relationships in data~m 100 100 6 6
  10. Classification
  11. Prediction
  12. Understanding~m 40 40 16 16
  13.  Exploiting database information
  14. ^!H` Representing how systems work !@!t 200 120 600 320
  15. ~c~w~m 0 20 8 0^!`Representing!:  corresponding to in essence.  ~
  16. Here, a computer model that simulates the behavior of a system.
  17. ^!`System!:  a regularly interacting or interdependent group of ~
  18. items forming a unified whole, ~
  19. i.e. any business, organization, governing body, country, economy or ~
  20. technology.
  21. ^!`Work!: to function or operate.`~
  22. .Rule ~c~
  23.  
  24.    ~C00~C00
  25.     ~C00Prediction~C00 
  26.      ~C00Variable~C00  
  27.    ~C00~C00                        ç                  ç
  28.      ~C00~C00                   ê     ê
  29.      ~C00Numbers~C00   àå                 Rule                      
  30.      ~C00~C00                       àå Induction àå   Visual    
  31.      ~C00Categories~C00 àå  Data                Analyst   
  32.      ~C00~C00                                  ç                        
  33.      ~C00Times~C00     àå  Prep          ê                    
  34.      ~C00~C00                               Rules         Resolution  
  35.      ~C00Opinions~C00  àå   &                    Importance  
  36.      ~C00~C00                                  ç           Distributions
  37.      ~C00Feeds~C00     àå Binning      ê       Quality    
  38.      ~C00~C00                       àå Inference àå             
  39.      ~C00Money~C00     àå                Engine                     
  40.      ~C00~C00                        
  41. .Inference ~c~
  42.  
  43.      ~C00~C00                                
  44.      ~C00~C00                                 Rules 
  45.      ~C00~C00                                
  46.      ~C00~C00                                    ç
  47.      ~C00~C00                   ê
  48.      ~C00Numbers~C00   àå                         
  49.      ~C00~C00                       àå           
  50.      ~C00Categories~C00 àå                         
  51.      ~C00~C00                                       
  52.      ~C00Times~C00     àå  Data         Inference      
  53.      ~C00~C00                                       àå Predictions 
  54.      ~C00Opinions~C00  àå Binning        Engine        
  55.      ~C00~C00                                       
  56.      ~C00Feeds~C00     àå                         
  57.      ~C00~C00                       àå           
  58.      ~C00Money~C00     àå                         
  59.      ~C00~C00                   
  60. .Advantages
  61. ~G~m 20 20 0 0
  62. ^!H` Quantitative learning from experience !@!t 200 235 600 400 ~m 0 0 8 0~
  63. ~c~wPeople learn from experience.  ~
  64. This is the most effective way to learn.
  65. Information Harvesting learns from the experiences captured in a database.  
  66. The Visual Analyst provides the tools for you to understand ~
  67. what Information Harvesting has learned.` ~m 20 20 16 16
  68. ^!H` Flexibility !@!t 200 250 600 400 
  69. ~c~wFlexibility~m 0 0 8 0
  70. Rules can adapt to multiple driving mechanisms since they do not assume ~
  71. that a single global model will explain the data.  ~
  72. All other modeling technologies, except Expert Systems, assume a ~
  73. single global model.`
  74. ^!H` Industrial Strength !@!t 200 250 600 400 
  75. ~c~wIndustrial Strength~m 0 0 8 0
  76. The technology can handle hundreds of variables and millions of data rows.
  77. Rule generation is robust in the face of missing values, erratic values ~
  78. and nonlinear behavior.`
  79. ^!H` Fit Consistency !@!t 220 240 600 400 
  80. ~c~wFit Consistency~m 0 0 8 0
  81. The rule generator uses a technique similar to statistical jackknifing ~
  82. to enhance the consistency of predictions by actively discriminating ~
  83. against overfitting.  ~
  84. You can trust the rules to work as well on new data as on the design data.`
  85. ^!H` Data ranking !@!t 200 140 600 300 
  86. ~c~wData Ranking~m 0 0 8 0
  87. The rules assign a ^!`quality! to the information content of each row ~
  88. of data.  ~
  89. This provides the information you need to evaluate each individual ~
  90. prediction as well as to upgrade the quality of your data acquisition.`
  91. ^!H` Understanding !@!t 200 120 600 330 
  92. ~c~wUnderstanding using the Visual Analyst:~m 20 60 8 0
  93. Global accuracy of the rules
  94. Importance of each variable for providing information about the ~
  95. prediction
  96. Cross relationships between all possible pairs of variables
  97. Data ^!`information quality! and its influence on every aspect of the results`~
  98. .How
  99. Suppose we want to predict the temperature based on the weather.  
  100. Consider the following table:
  101. ~b~m 80 80 0 0 
  102.  
  103. 
  104.  Sunny  Hot 
  105. 
  106.    1     1  
  107.    1     1  
  108.    1     1  
  109.    1     0  
  110.    1     0  
  111.    1     0  
  112.    1     0  
  113.    1     0  
  114. 
  115.    0     1  
  116.    0     0  
  117.    0     0  
  118.    0     0  
  119. 
  120. ~t~m 0 0 8 0
  121. \We can make an accurate prediction that the temperature will be hot 
  122. only 3 out of 8 times.  
  123. This is not a great predictor.
  124. \\Suppose we add further information conerning the season:
  125. ~b~m 80 80 0 0
  126.  
  127. 
  128.  Sunny  Summer  Hot 
  129. 
  130.    1      1      1  
  131.    1      1      1  
  132.    1      1      1  
  133.    1      1      0  
  134. 
  135.    1      0      1  
  136.    1      0      1  
  137.    1      0      0  
  138.    1      0      0  
  139. 
  140.    0      0      1  
  141.    0      0      0  
  142.    0      0      0  
  143.    0      0      0  
  144. 
  145. ~t~m 0 0 8 0
  146. \If the weather is sunny and the season is summer, 
  147. we can predict it will be hot 3 out of 4 times.
  148. \\\Information Harvesting finds its rules by considering massive 
  149. numbers of such truth tables.
  150.